bike_rental - Datenbasis SQL

Der vorliegende Datensatz enthält Daten von der Vermietung von Fahrrädern in der Region San Francisco.

Die Datenbasis ist eine SQLite3-tabelle.

Der Datensatz hat viel Potential von Analysen. Zu Beginn soll es allerdings reichen, dass du deine bisherigen Fähigkeiten und Kenntnisse übst und vertiefst.

Aufgabe/Ziel:

         - mache dich mit den Daten vertraut
         - schließe dich an die Datenbank an und erkunde die Metadaten(welche Tabellen mit welchen Spalten 
           liegen vor? etc...
         - Welche Erkenntnisse kannst du ziehen. Visualisiere diese gern mit ein paar Plots. Es ist egal welche                    Bibliothek du verwendest


Du kannst erkunden was du möchtest. Ziel ist, dass du erkennst, was du bereits alles kannst!

Wofür stehen die Spalten?

Tabelle: Status

-station_id: station ID number

-bikes_available: number of available bikes

-docks_available: number of available docks

-time: date and time, PST

Tabelle: Station Information

-station_id: station ID number (corresponds to "station_id")

-name: name of station

-lat: latitude

-long: longitude

-dockcount: number of total docks at station

-landmark: city (San Francisco, Redwood City, Palo Alto, Mountain View, San Jose)

-installation: original date that station was installed. If station was moved, it is noted below.

Tabelle: TRIP DATA

-Trip ID: numeric ID of bike trip

-Duration: time of trip in seconds

-Start Date: start date of trip with date and time, in PST

-Start Station: station name of start station

-Start Terminal: numeric reference for start station

-End Date: end date of trip with date and time, in PST

-End Station: station name for end station

-End Terminal: numeric reference for end station

-Bike #: ID of bike used

-Subscription Type: Subscriber = annual or 30-day member; Customer = 24-hour or 3-day member

-Zip Code: Home zip code of subscriber (customers can choose to manually enter zip at kiosk however data is unreliable)

Tabelle: WEATHER DATA

Daily weather information per service area, provided from Weather Underground in PST. Weather is listed from north to south (San Francisco, Redwood City, Palo Alto, Mountain View, San Jose).

Tables Info

Tablle 'STATION'

!!! Achtung !!!: Spalte 'installation_date' ist im Textformat.

-- Tabele 'STATION' enthält die Information über die 70 Stationen aus 5 Städten in California.

Tablle 'STATUS'

!!! Achtung !!!: Spalte 'time' ist im Textformat.

Info über der Status der Stationen wurde jeder Minute in die Tabelle 'STATUS' gespeichert.

time fotmat: 2013/08/29 12:06:01 -> YYYY/MM/DD MM:HH:SS

-- Die Information in der Tabelle 'STATUS' verfügt von 2013/08/29 12:06:01 bis zum 2015-08-31 23:59:02

Tablle 'TRIP'

time -> TEXT !!!!!!!!!!!!!!

-- Es gibt die Information fast über 700 Tsd. Reisen.
-- Es steht ein Bestand von 700 Fahrrädern zum Ausleihen zur Verfügung.

Tabelle 'WEATHER'

Data Frame Vorbereitung

station_info_df

trip_customer_df

Ohne Bikes oder Docks

Eine kritische Anzahl von Fahrrädern oder Docking-Stationen

SF Status 16.04.2014

Visualisirung

Wo habe ich welche Stationen?

Verteilung der Fahrradverleihstationen nach Städten

-- Fahrradverleihstationen gibt es in fünf kalifornischen Städten

Fahrradverleihstationen auf der Karte

Verteilung der Fahrradverleihstationen nach Städten

Top 10 der am häufigsten verwendeten Stationen

Daten der Installation der Stationen

Welche Customer habe ich?

Die Gesamtzahl der Fahrten je nach Art des Abonnements

---> Die meisten Benutzer haben ein Fahrradverleih-Abonnement

Die Gesamtzahl der Fahrten in Abhängigkeit vom Wochentag

Gesamtzahl der Fahrten pro Wochentag je nach Abonnementstyp

Gesamtzahl der Fahrer nach Stadt

---> 90% der Reisen sind in San Francisco

Auswertung der Tripdaten

Zu welcher Tageszeit wird der Service am häufigsten genutzt?

Das Diagramm zeigt, dass der Dienst an Wochentagen morgens und abends am meisten genutzt wird, an Wochenenden in der Mitte des Tages.

---> Stellen wir die durchschnittliche Wochenend- und Wochentagskurve dar.

Zu welcher Zeit Customer den Service nutzen, zu welcher Zeit Subscriber den Service nutzen

Fahrtdauer

-- Die Mindestfahrzeit beträgt eine Minute.
-- Mittlere Reisezeit von etwa achteinhalb Minuten
-- Es gibt Ausreißer. Die maximale Reisedauer beträgt 287840 Minuten, das sind fast 200 Tage.

Deshalb überprüfen die Anzahl der Fahrten, die weniger als zwei Minuten und mehr als einen Tag dauern

Fahrten, die kürzer als zwei Minuten sind

!!! Fast ein Prozent der Fahrten unter zwei Minuten ist.

Fahrten, die länger als 24 Stunden dauern

Wenn sich Personen ein Fahrrad länger ausleihen und bei sich stehen haben, kann niemand anderes es nutzen.

--> Daher prüfen, ob es mit dem Art des Abonnements zusammenhängt.

Die Customer verhalten sich deutlich anders als die Subscriber.

-- Die Subscriber haben eine allgemein viel kürzere Nutzungsdauer.
-- Was ist mit Dauern kleiner als eine Minute?
-- Sind die langen Nutzungen bezahlt worden? Muss dort früher nachgehackt werden?
-- Haben Kunden ein Rad dauerhaft bei sich? (Aboschwäche?)

Roundtrips

-- Die Customer scheinen Roundtrips eher lange und häufiger zu machen in Form von Ausflügen. Die Subscriber machen eher kürzere Fahrten (Besorgungen?)

Intercity-Fahrten

-- Die Daten enthält Informationen über 1.042 Intercity-Fahrten

Durchschnittliche Fahrtdauer je nach Art des Abonnements und Wochentag

An welchen Stationen es Probleme gibt?

-- Für über 1% der Zeit sind die Stationen nicht voll nutzbar.
-- Und zu etwa 2.5% der Zeit sind an den Stationen nur noch eine kritische Anzahl an Docks oder Fahrrädern verfügbar.

Animation: San Francisco 16 April 2014 (Mittwoch)

Station 'San Francisco Caltrain (Townsend at 4th)' (ID = 70)